Преобразование необработанных наблюдений в структурированные объекты R является техническим процессом, необходимым для вероятностного анализа. До моделирования распределений мы должны освоить ввод данных и структурные нюансы между списками, матрицами и объектами типа данных.
1. Структурированный ввод
Импорт данных через scan() часто требует создания заготовочного структурированного списка для определения типов переменных (например, list(id="", x=0)). Это гарантирует, что внешние данные из файлов, таких как input.dat будут обработаны в управляемые компоненты, а не в плоские векторы.
2. Организация по размерности
Хотя матрица используется для однородных числовых наборов (с использованием byrow=TRUE), то data.frame() выступает в качестве основного моста для статистического моделирования, позволяя разнородным типам данных сосуществовать.
3. Доступ к переменным
Доступ к данным для вывода включает индексацию через inp[[1]] или поименованным столбцам, например inp$id. Функции, такие как attach() позволяют обращаться к переменным в целом объекте всего объекта (например, eruptions) напрямую без повторной индексации.